智能论文笔记

CNN-based Prediction of Network Robustness With Missing Edges

Chengpei Wu , Yang Lou , Ruizi Wu , Wenwen Liu , Junli Li

分类：机器学习

2022-08-25

复杂网络的连接性和可控性是两个重要问题，可以保证网络系统运行。连通性和可控性的鲁棒性可确保系统在各种恶意攻击下正常稳定地运行。使用攻击模拟评估网络鲁棒性是很耗时的，而基于卷积的神经网络（CNN）的预测方法为近似网络鲁棒性提供了一种具有成本效益的方法。在本文中，我们研究了基于CNN的方法的连接性和可控性鲁棒性预测的性能，当缺少部分网络信息时，即邻接矩阵不完整。进行了广泛的实验研究。探索阈值是，如果丢失了总数超过7.29 \％的信息，则在实验中所有情况下，基于CNN的预测的性能将显着退化。比较了缺少边缘表示的两种情况，1）在预测输入中，缺失边缘标记为“无边”，而2）使用“未知”的特殊标记表示缺失的边缘。实验结果表明，第一个表示对基于CNN的预测因子误导了。

translated by 谷歌翻译

HTML版本

UniLayout: Taming Unified Sequence-to-Sequence Transformers for Graphic Layout Generation

Zhaoyun Jiang , Huayu Deng , Zhongkai Wu , Jiaqi Guo , Shizhao Sun , Vuksan Mijovic , Zijiang Yang , Jian-Guang Lou , Dongmei Zhang

分类：计算机视觉

2022-08-17

为了满足各种用户需求，近年来对图形布局的不同子任务进行了深入探讨。现有研究通常提出具有不同投入输出格式，专用模型体系结构和不同学习方法的任务特异性方法。但是，这些专业的方法使得适应了看不见的子任务，阻碍了不同子任务之间的知识共享，并且与设计通用模型的趋势背道而驰。在这项工作中，我们提出了Unilayout，该Unilayout以统一的方式处理图形布局生成的不同子任务。首先，我们统一地表示子任务的各种输入和输出作为令牌序列。然后，基于统一的序列格式，我们自然利用具有不同子任务的变压器的相同的编码器架构。此外，基于上述两种统一，我们进一步开发了一个同时支持所有子任务的单个模型。在两个公共数据集上的实验表明，尽管简单，单层虽然明显优于先前的特定于任务的方法。

translated by 谷歌翻译

Fast Heterogeneous Federated Learning with Hybrid Client Selection

Guangyuan Shen , Dehong Gao , DuanXiao Song , libin yang , Xukai Zhou , Shirui Pan , Wei Lou , Fang Zhou

分类：机器学习 | 人工智能

2022-08-10

在最新的联合学习研究（FL）的研究中，广泛采用了客户选择方案来处理沟通效率的问题。但是，从随机选择的非代表性子集汇总的模型更新的较大差异直接减慢了FL收敛性。我们提出了一种新型的基于聚类的客户选择方案，以通过降低方差加速FL收敛。简单而有效的方案旨在改善聚类效果并控制效果波动，因此，以采样的一定代表性生成客户子集。从理论上讲，我们证明了降低方差方案的改进。由于差异的差异，我们还提供了提出方法的更严格的收敛保证。实验结果证实了与替代方案相比，我们计划的效率超出了效率。

translated by 谷歌翻译

HybridGNN: Learning Hybrid Representation in Multiplex Heterogeneous Networks

Tiankai Gu , Chaokun Wang , Cheng Wu , Jingcao Xu , Yunkai Lou , Changping Wang , Kai Xu , Can Ye , Yang Song

分类：机器学习

2022-08-03

最近，图神经网络显示了建模基于网络的推荐系统中复杂拓扑结构的优势。由于节点之间的各种相互作用以及来自各种类型的节点和边缘的大量语义，因此在多重异质网络中学习表达性节点表示的研究兴趣爆发。推荐系统中最重要的任务之一是预测特定边缘类型下两个节点之间的潜在连接（即关系）。尽管现有的研究利用明确的元数据来汇总邻居，但实际上，它们仅考虑了关系内部的元数据，因此无法通过相互关联信息来利用潜在的提升。此外，在各种关系下，尤其是在越来越多的节点和边缘类型的情况下，全面利用相互关系的元数据并不总是直接的。此外，两个节点之间不同关系的贡献很难衡量。为了应对挑战，我们提出了Hybridgnn，这是一种具有混合聚集流和分层的端到端GNN模型，以在多路复用方案中充分利用异质性。具体而言，Hybridgnn应用了一个随机的关系探索模块来利用不同关系之间的多重性属性。然后，我们的模型利用在关系内的元数据和随机探索下的混合聚集流以学习丰富的语义。为了探索不同聚合流的重要性并利用多重性属性，我们提出了一个新型的分层注意模块，该模块既利用了Metapath级别的注意力和关系级的关注。广泛的实验结果表明，与几个最先进的基线相比，Hybridgnn取得了最佳性能。

translated by 谷歌翻译

Adversarial Contrastive Learning via Asymmetric InfoNCE

Qiying Yu , Jieming Lou , Xianyuan Zhan , Qizhang Li , Wangmeng Zuo , Yang Liu , Jingjing Liu

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-18

对比度学习（CL）最近已应用于对抗性学习任务。这种实践将对抗样本视为实例的其他积极观点，并且通过彼此达成最大的协议，可以产生更好的对抗性鲁棒性。但是，由于对抗性扰动可能会导致实例级别的身份混乱，因此这种机制可能存在缺陷，这可能会通过用单独的身份将不同的实例聚集在一起来阻碍CL性能。为了解决这个问题，我们建议在形成鲜明对比时不平等地对待对抗样本，与不对称的Infonce目标（$ a-Infonce $）允许区分对抗样本的考虑。具体而言，对手被视为降低的阳性，会引起较弱的学习信号，或者是与其他负面样本形成较高对比的艰难负面因素。以不对称的方式，可以有效地减轻CL和对抗性学习之间相互冲突目标的不利影响。实验表明，我们的方法始终超过不同鉴定方案的现有对抗性CL方法，而无需额外的计算成本。提出的A-INFONCE也是一种通用形式，可以很容易地扩展到其他CL方法。代码可从https://github.com/yqy2001/a-infonce获得。

translated by 谷歌翻译

CERT: Continual Pre-Training on Sketches for Library-Oriented Code Generation

Daoguang Zan , Bei Chen , Dejian Yang , Zeqi Lin , Minsu Kim , Bei Guan , Yongji Wang , Weizhu Chen , Jian-Guang Lou

分类：自然语言处理

2022-06-14

代码生成是一个长期的挑战，旨在根据自然语言描述生成代码段。通常，昂贵的文本编码配对数据对于培训代码生成模型至关重要。最近，由于培训预培训技术的成功，大型语言模型接受了大规模未标记的代码语料库的培训，并在代码生成方面表现良好。在本文中，我们调查了如何利用未标记的代码语料库来训练以图书馆为导向的代码生成的模型。由于对于程序员重复使用第三方库是一种普遍的做法，因此由于库数量大量，文本编码配对数据很难获得。我们观察到面向图书馆的代码片段更有可能共享类似的代码草图。因此，我们为证书提供了两个步骤：草图器生成草图，然后发电机填充了草图中的详细信息。 Sketcher和Generator都使用未标记的数据在基本模型上不断预先训练。此外，我们制作了两个名为Pandaseval和NumpyeVal的基准，以评估面向图书馆的代码生成。实验结果证明了CERT的表现令人印象深刻。例如，它超过了基本模型，在pandaseval上的Pass@1方面，绝对提高了15.67％。我们的工作可在https://github.com/microsoft/pycodegpt上获得。

translated by 谷歌翻译

CANShield: Signal-based Intrusion Detection for Controller Area Networks

Md Hasan Shahriar , Yang Xiao , Pablo Moriano , Wenjing Lou , Y. Thomas Hou

分类：机器学习

2022-05-03

现代车辆依靠通过控制器区域网络（CAN）巴士连接的电子控制装置（ECU）的车队进行关键的车辆控制。但是，随着汽车中高级连通性特征的扩展以及内部系统暴露的风险升高，罐头总线越来越容易受到侵入和注射攻击。普通的注射攻击破坏了CAN数据流的典型定时属性，基于规则的入侵检测系统（IDS）可以轻松检测它们。但是，高级攻击者可以将虚假数据注入到时间序列的感官数据（信号），同时通过CAN消息的模式/频率看起来无害。此类攻击可以绕过基于规则的ID或基于二进制有效载荷数据的任何基于异常的ID。为了使车辆强大地抵抗这种智能攻击，我们提出了CANSHIELD，这是一个基于信号的侵入式检测框架。 Canshield由三个模块组成：一个数据预处理模块，该模块在信号级别处理高维CAN数据流并使其适合深度学习模型；一个由多个深度自动编码器（AE）网络组成的数据分析仪模块，每个网络都从不同的时间角度分析时间序列数据；最后，使用集合方法来做出最终决定的攻击检测模块。对两个高保真信号的评估结果可以攻击数据集显示Canshield在检测高级入侵攻击方面的高精度和反应性。

translated by 谷歌翻译

Understanding Pixel-level 2D Image Semantics with 3D Keypoint Knowledge Engine

Yang You , Chengkun Li , Yujing Lou , Zhoujun Cheng , Liangwei Li , Lizhuang Ma , Weiming Wang , Cewu Lu

分类：计算机视觉

2021-11-21

像素级别的2D对象语义理解是计算机视觉中的一个重要主题，可以帮助在日常生活中深入了解对象（例如功能和可折扣）。然而，最先前的方法直接在2D图像中的对应关系上培训，这是端到端，但在3D空间中失去了大量信息。在本文中，我们提出了一种关于在3D域中预测图像对应语义的新方法，然后将它们突出回2D图像以实现像素级别的理解。为了获得当前图像数据集中不存在的可靠的3D语义标签，我们构建一个名为KeyPointNet的大型关键点知识引擎，其中包含103,450个关键点和来自16个对象类别的8,234个3D模型。我们的方法利用3D视觉中的优势，并可以明确地理由对物体自动阻塞和可见性。我们表明我们的方法在标准语义基准上给出了比较甚至卓越的结果。

translated by 谷歌翻译

PRIN/SPRIN: On Extracting Point-wise Rotation Invariant Features

Yang You , Yujing Lou , Ruoxi Shi , Qi Liu , Yu-Wing Tai , Lizhuang Ma , Weiming Wang , Cewu Lu

分类：计算机视觉

2021-02-24

点云分析没有姿势前导者在真实应用中非常具有挑战性，因为点云的方向往往是未知的。在本文中，我们提出了一个全新的点集学习框架prin，即点亮旋转不变网络，专注于点云分析中的旋转不变特征提取。我们通过密度意识的自适应采样构建球形信号，以处理球形空间中的扭曲点分布。提出了球形Voxel卷积和点重新采样以提取每个点的旋转不变特征。此外，我们将Prin扩展到称为Sprin的稀疏版本，直接在稀疏点云上运行。 Prin和Sprin都可以应用于从对象分类，部分分割到3D特征匹配和标签对齐的任务。结果表明，在随机旋转点云的数据集上，Sprin比无任何数据增强的最先进方法表现出更好的性能。我们还为我们的方法提供了彻底的理论证明和分析，以实现我们的方法实现的点明智的旋转不变性。我们的代码可在https://github.com/qq456cvb/sprin上找到。

translated by 谷歌翻译

Computing Cliques and Cavities in Networks

Dinghua Shi , Zhifeng Chen , Xiang Sun , Qinghua Chen , Chuang Ma , Yang Lou , Guanrong Chen

分类：神经与进化计算

2021-01-03

复杂网络包含完整的子图，例如节点，边缘，三角形等，称为不同订单的简单和批分。值得注意的是，由高阶派系组成的空腔在大脑功能中起重要作用。由于搜索最大批变是一个NP完整的问题，因此我们使用K-Core分解来确定给定网络的可计算性。对于可计算的网络，我们设计具有可实现的算法的搜索方法，用于查找不同订单的Cliques，还获得欧拉特征数。然后，我们通过使用相邻派系的边界矩阵的级别来计算Betti号。此外，我们设计了一种用于查找不同订单的空腔的优化算法。最后，我们将该算法应用于来自一个典型数据集的数据的C.杆杆线虫的神经元网络，并找到其所有不同订单的群体和一些空腔，为其结构和功能提供了进一步的数学分析和计算的基础。

translated by 谷歌翻译